03. 编写分析脚本

编写分析脚本

能够编写和运行脚本对于编程任务和项目非常重要。

你可以在文本编辑器中编写代码,然后在终端中运行该文件。以下是打印收入普查数据集列名称的简单示例。如果你使用右边所示的代码将文件保存为 .py 文件,则可以如左图所示运行它。确保你保存在该文件的同一个目录中!

你最好将分析功能分组到函数中并在主函数中运行它们。这有助于组织代码并尽可能泛化。

下面的脚本创建了一个包含高收入和低收入人群的双重年龄直方图。

你可以想象如果我们有更多的双重直方图,可以如何重复使用 plot_hist 。此函数甚至可以更加泛化。如果我们为这个数据集创建了许多可视化的脚本,主函数中的查询逻辑应该可以转到另一个函数。如果这个项目变得很大,我们甚至可以将我们的代码分成不同的文件或模块,使其更加有条理。

这些只是介绍不同工作流程的简单示例。终端编写和运行脚本是非常灵活和强大的编程方式。这是比 Jupyter notebook 更为理想的开发环境 - Jupyter notebook 也非常有用,但更适合于报告等。

我强烈建议你尽快熟悉一个好的文本编辑器,并使用终端。然后,你便可以自动化脚本,每天早上从数据库中提取数据,获取信息!即使你不喜欢这些花哨的东西,熟悉好的文本编辑器和使用终端仍然是非常有价值的。